SMEPilot: Optimización de Inferencia de LLM con Extensiones de Matriz Acelera la inferencia de LLM hasta 3.94x combinando CPU y extensiones SME. Descubre cómo SMEPilot optimiza atención y particionado de matrices. 2026-06-16 · 2 min